Investigation of self-supervised pre-trained models for classification of voice quality from speech and neck surface accelerometer signals

نویسندگان

چکیده

Prior studies in the automatic classification of voice quality have mainly studied use acoustic speech signal as input. Recently, a few been carried out by jointly using both and neck surface accelerometer (NSA) signals inputs, extracting MFCCs glottal source features. This study examines simultaneously-recorded NSA (breathy, modal, pressed) features derived from three self-supervised pre-trained models (wav2vec2-BASE, wav2vec2-LARGE, HuBERT) SVM well CNNs classifiers. Furthermore, effectiveness is compared feature extraction between waveforms raw for inputs. Using two processing methods (quasi-closed phase (QCP) inverse filtering zero frequency (ZFF)), are estimated signals. The has main goals: (1) to whether improve accuracy conventional (spectrogram, mel-spectrogram, MFCCs, i-vector, x-vector), (2) investigate which modalities (speech vs. NSA) more effective task with model-based features, (3) evaluate deep learning-based CNN classifier can enhance comparison classifier. results revealed that input showed better performance signal. Between accuracies, inputs It was also found HuBERT performed than wav2vec2-BASE wav2vec2-LARGE

برای دانلود رایگان متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

the innovation of a statistical model to estimate dependable rainfall (dr) and develop it for determination and classification of drought and wet years of iran

آب حاصل از بارش منبع تأمین نیازهای بی شمار جانداران به ویژه انسان است و هرگونه کاهش در کم و کیف آن مستقیماً حیات موجودات زنده را تحت تأثیر منفی قرار می دهد. نوسان سال به سال بارش از ویژگی های اساسی و بسیار مهم بارش های سالانه ایران محسوب می شود که آثار زیان بار آن در تمام عرصه های اقتصادی، اجتماعی و حتی سیاسی- امنیتی به نحوی منعکس می شود. چون میزان آب ناشی از بارش یکی از مولفه های اصلی برنامه ...

15 صفحه اول

the effect of self-confidence and educational motivation on oral translation quality

this thesis is about the effect of self-confidence and educational motivation on oral translation quality.

an investigation of the impact of self monitoring on langauge teachers motivational practice and its effect on learners motivation

the central purpose of this study was to conduct a case study about the role of self monitoring in teacher’s use of motivational strategies. furthermore it focused on how these strategies affected students’ motivational behavior. although many studies have been done to investigate teachers’ motivational strategies use (cheng & d?rnyei, 2007; d?rnyei & csizer, 1998; green, 2001, guilloteaux & d?...

effect of seed priming and irrigation regimes on yield,yield components and quality of safflowers cultivars

این مطالعه در سال 1386-87 در آزمایشگاه و مزرعه پژوهشی دانشگاه صنعتی اصفهان به منظور تعیین مناسب ترین تیمار بذری و ارزیابی اثر پرایمینگ بر روی سه رقم گلرنگ تحت سه رژیم آبیاری انجام گرفت. برخی از مطالعات اثرات سودمند پرایمینگ بذر را بر روی گیاهان مختلف بررسی کرده اند اما در حال حاضر اطلاعات کمی در مورد خصوصیات مربوط به جوانه زنی، مراحل نموی، عملکرد و خصوصیات کمی و کیفی بذور تیمار شده ژنوتیپ های م...

ذخیره در منابع من


  با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ژورنال

عنوان ژورنال: Computer Speech & Language

سال: 2023

ISSN: ['1095-8363', '0885-2308']

DOI: https://doi.org/10.1016/j.csl.2023.101550